蛋白质结构研究入门,你都知道吗(上)? 您所在的位置:网站首页 western blot 里的标记蛋白叫什么 蛋白质结构研究入门,你都知道吗(上)?

蛋白质结构研究入门,你都知道吗(上)?

2023-03-12 04:39| 来源: 网络整理| 查看: 265

原文链接:https://mp.weixin.qq.com/s/RPIRfPUDadPGMNzV5tbAFQ

听说颜宁女神来到生化所做演讲,引发了围观热潮,举办方不得已临时更换了演讲场所。小师弟我因为挤不进去,未能一睹女神风采,不过有同学朋友圈发了现场照片,大家可以感受一下。

听说上一次引发同样现象的,还是施一公教授来此演讲——果然是名师出高徒啊!施一公教授和颜宁教授都是国际顶级的结构生物学研究者,小师弟想借此机会,和大家聊一聊结构生物学相关的知识。

颜宁教授

结构生物学主要是通过解析生物大分子的具体三维结构,从最底层详细阐明各种分子的作用机制,如酶的催化机制、信号通路中互作分子的互作机制以及疾病发生过程中蛋白质折叠变化(想起疯牛病和阿尔兹海默症没有?)等。

获得各种生物大分子的结构,尤其是蛋白质分子的结构在很多领域都具有重要作用。比如根据靶标蛋白的结构进行理性药物设计以及理性筛选

用于获得生物大分子结构的实验手段主要有3大类:(1)X射线(现在基本上都是同步辐射光源用于解析结构),(2)核磁共振(NMR)以及(3)冷冻电镜(cryo-EM)。三种方法都及其依赖于大型设施/仪器的应用。

上海光源(Shanghai Synchrotron Radiation Facility,SSRF)

虽然已经解析出来的蛋白质结构日益增多(可以到蛋白质结构数据库PDB中查询其结构是否被解析),但是很多小伙伴们的研究目标的结构还没有被解析(实际上是大部分蛋白结构都没有被解析)。

蛋白质结构数据库PDB:http://www.rcsb.org/

那么,在实验之外,有其他方法获得生物大分子的结构吗?当然有啊,那就是结构预测啊。

PS:结构预测获得的结构不一定准确,不过近年来随着数据库的扩大以及算法的改进,结构预测的准确性越来越高。

关于核酸RNA二级结构的预测,之前我们公众号介绍过RNAstructure的使用:《如何绘制高大上的RNA 二级结构图?》(关于RNA三级结构的预测,我们稍后会有推文。)我们先来介绍一下蛋白质结构的预测。

一、背景介绍

蛋白质的结构从低维度到高维度划分为四级:

一级结构——氨基酸序列;

二级结构——主链原子形成的局部空间构象,如α螺旋,β折叠;

三级结构——二级结构在三维空间排列形成三维结构;

四级结构——不同亚基组成的蛋白质复合物大分子。

在二级结构和三节结构之间,还存在超二级结构(有些书籍称作motif,模体/基序)以及结构域。

二、工具使用

从一级序列我们能够获得哪些信息呢?小师弟在此给大家安利一个网站,https://web.expasy.org/protparam/。

它的主界面非常简单,我们可以输入蛋白质的AC号或者蛋白质序列,然后点击compute parameters, 然后就可以获得这个蛋白质的诸多信息了。

PS:ExPASy 是一个神器的网站,大家可以通过网址https://www.expasy.org/resources来访问其提供的各种生物信息学工具,有很多妙用哦!之前我们在研究Protein,这些技术不得不看中有提到其中的PROSITE的用法。

在跳转出来的结果页,我们可以获得如下一些信息:

蛋白质分子的氨基酸数量及其相对分子质量,

理论等电点,

氨基酸组成及其带电氨基酸数量,

原子组成和分子式,

消光系数/吸收度,

半衰期,

不稳定系数,

脂肪性系数以及该蛋白质的总平均亲水性。

三、结果解读和研究意义

分子质量在SDS-PAGE电泳以及western blot中非常有用。但是,在SDS-PAGE或者western blot实验中,分子条带大小并一定和此处给的完全相符,排除了未充分煮样等实验操作失误外,还可能是因为这些蛋白带电荷过于特殊,有别于正常蛋白。对于蛋白分子质量,我们还可以使用氨基酸残基数目*110来快速估算。

等电点就是电解质在此pH下,其所带的正电荷和负电荷一样多,导致其净电荷为0。理论等电点在等电聚焦以及使用离子交换层析分离纯化蛋白时非常有用。使用离子交换层析分离纯化两个蛋白,一般需要两个蛋白等电点相差至少0.5。对于常见的蛋白纯化亲和标签,一般都已经通过基因工程改造,将其等电点改造成明显偏离普通蛋白的等电点。如His-sumo标签的等电点为5.4,GST标签的等电点为5.6,MBP标签的等电点为4.9。而大多数蛋白的等电点为偏酸性,略低于7,因此可以方便的使用离子交换层析方法分离亲和标签和不含标签的目的蛋白。

氨基酸组成方面,我们可以方便的看到20种氨基酸占比(有几个氨基酸在大多数蛋白中的占比相对恒定,此是诸多蛋白质浓度测定的统计学基础)。有细心的小伙伴可能发现,在20种氨基酸下面,还有3个氨基酸符号,那是什么东东?说实话,第一次打开这个结果页,我也被这三个符号唬住了。本着科研狗+理工男的严谨精神(对,我大生物就是理科,那些常常怼生物像文科的,别逼逼,我不接受反驳,小师弟要傲娇一回),我立马查询一番,原来,B就是Asx,Aspartic acidor Asparagine(天冬氨酸或者天冬酰胺);Z就是Glx,Glutamine or Glutamic acid(谷氨酰胺或者谷氨酸);X就是Xaa,Any amino acid(任意氨基酸)。也就是说,这3个符号是用来表示暂时还有歧义的氨基酸残基的,并不是什么稀有氨基酸。

下面还有荷电氨基酸统计。分别统计了带负电氨基酸(天冬氨酸和谷氨酸)的数量,以及带正电氨基酸(赖氨酸和精氨酸)的数量。有小伙伴可能会好奇,碱性氨基酸不是赖氨酸、精氨酸、组氨酸3个吗?这里面为什么没有组氨酸呢?因为组氨酸是一种弱碱性氨基酸,在生理状态下基本上不带电的。不信,我给你看个表格。

我们可以看到,组氨酸的等电点为7.59,而人体血液的pH在7.35-7.45,其他多种体液也都是偏弱碱性(当然,胃液这种变态不算的,它的pH变态的为0.9-1.5),所以说组氨酸在生理状态下基本上不带电,所以就不参与统计喽!

酸碱体质理论

消光系数和吸收度:根据朗伯比尔定律A=lg(1/T)=Kbc (A为吸光度,T为透射比,是出射光强度(I)比入射光强度(I0),c为吸光物质的浓度,单位为mol/L,b为吸收层厚度,单位为厘米),吸光度和溶液中的溶质浓度以及光程长度成正比,这个比例系数K就是我们的消光系数。那么消光系数有什么用呢?我们可以通过分光光度计测量出吸光度值Abs(测量入射光和出射光的比值,并取对数),然后除以(光程*消光系数),就可以知道蛋白质的浓度了。

简单的来说,我们取1 ul蛋白溶液,使用nanodrop测量出吸光度值A,然后直接除以这里给的吸收度,就可以得到蛋白质浓度了(nanodrop默认的设置是1 Abs=1mg/ml)。

整个过程不超过2分钟,比起Bradford,Lowry之流测蛋白浓度,不知道要快多少倍。

实际上,这个消光系数和吸收度我们自己都可以计算出来的,计算方法也很简单:

消光系数=Numb(Trp)*5500 + Numb(Tyr)*1490+Numb(Cystine)*125

吸收度=消光系数/分子质量

Numb表示个数

从上述公式,我们也可以知道,一个蛋白质分子的消光系数主要取决于色氨酸(要不怎么叫做“色”氨酸呢?)、酪氨酸以及胱氨酸的含量。如果一个序列中含有多个半胱氨酸,考虑到两个半胱氨酸可以被氧化生成一个胱氨酸,因此,有多个半胱氨酸的序列,ExPASy都给了两个消光系数,一个是所有半胱氨酸都用于生成胱氨酸,一个是所有半胱氨酸都是还原形式,没有生成任何胱氨酸。小伙伴们可以用计算器根据前面氨基酸组成的图,按照这里的公式计算一下消光系数和吸收度,看是否一致哦!

我为什么详细介绍消光系数的计算呢?因为很多小伙伴在蛋白实验中会做突变分析,现在我们知道了,如果没有消除或者新增色氨酸、酪氨酸以及半胱氨酸,一个蛋白的消光系数是不会发生变化的(吸收度会变化一点点,因为分子质量会有一点点变化,不过基本上不用考虑),那么我们就不用重新计算消光系数了。

 半衰期:半衰期用来衡量目的蛋白在体内的稳定性。蛋白质在细胞中处于动态平衡,在其合成之后,它的寿命基本上就已经决定了。也就是说,细胞这个家伙为了保证自己的运转正常,给大多数蛋白都设定了一个使用期限,防止超期限执行任务的蛋白因为老化而出错,而衰老的蛋白会被回收利用或者消除(小师弟感受到了强烈的宿命论!!!)。

而决定这个使用期限(用半衰期表示)的,就是蛋白质自身N端的前几个氨基酸序列。因此,这个ExPASy程序会把我们输入序列的前几个氨基酸当做N端序列计算这个蛋白质的半衰期,并且给出了在哺乳动物网织红细胞、酵母和大肠杆菌这3种模式细胞中的半衰期。

文章中经常通过蛋白半衰期来研究泛素化-蛋白酶体途径介导的蛋白降解

不稳定系数:不稳定系数用来衡量目的蛋白在体外的稳定性。不稳定系数基于之前研究者的发现,也即某些二肽在稳定蛋白和不稳定蛋白中的出现概论相差很大,因此,可以通过这些二肽的出现频率来预测蛋白质在体外的稳定性。不稳定系数越小,表明此蛋白越稳定。在判别标准上,将不稳定系数小于40的蛋白判定为能够稳定存在。结合小师弟多年纯化蛋白的经验(苦逼经历),这项预测还是相对比较准确的。对于被预测为不稳定的蛋白,尤其是那些数值远远大于40的目的蛋白,小伙伴如果对其进行操作,一定要加快实验进度哦,因为这些蛋白在4℃放个两三天,就可能降解了哦!

脂肪系数:脂肪系数也可以用来衡量目的蛋白的稳定性。我们知道,蛋白质折叠的一个主要驱动力就是疏水相互作用。而脂肪系数用丙氨酸、缬氨酸、亮氨酸、异亮氨酸这4个疏水氨基酸的出现频次*相关权重并加和,得到了一个脂肪系数。脂肪系数越高,蛋白相对越稳定。

总平均亲水性:用于衡量目的蛋白的总体平均亲水性。通过将亲水氨基酸赋正值,将疏水氨基酸赋负值,加和后除以氨基酸数目,得到总体的平均亲疏水性。数值越大,亲水性越强。实际上,对于多结构域蛋白此数值意义不是很大,因为蛋白分子中既有疏水结构域,也有亲水结构域,两者数值会相互抵消。GRAVY主要是结合局部亲疏水性打分,获得如下图所示亲疏水性打分图,可以用来预测跨膜区(跨膜区相对于总体序列高度疏水,峰图中间横线就是代表总平均亲水性)。

好了,内容就到这里。第一次写推文,可能有点过于详细和啰嗦,大家多提点意见,以后小师弟我多多改进。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有